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Proc6de d'estimation de la pertinence d'un document par rapport k un concept 

La prdsente invention concerne un procede d'estimation de la pertinence d'un 
document par rapport k un concept. 
5 Un proc6d6 classique d'estimation de la pertinence d'un document par rapport k un 

concept comprend le catcul d'une fonction de pertinence du concept par rapport k ce 
document s'appuyant sur la connaissance d'un voisinage s6mantique predetermine de ce 
concept. 

On appelle voisinage s6mantique d'un concept, un ensemble de concepts reti6s k 
10 ce concept par diffdrents liens s6mantiques dans une base de connaissances. 

En g6n6ral, lorsqu'on calcule la pertinence d'un document par rapport k un concept, 
la fonction calcu!6e prend en compte dans son estimation la presence dans le document 
du concept lui-mdme, ainsi que celle de tous les concepts appartenant k son voisinage 
s6mantique. 

15 Par consequent, le r6sultat d'une requ§te d'estimation d'un document par rapport k 

un concept peut Stre erron6 lorsque ce concept est ambigu, c'est k dire lorsqu'il comports 
plusieurs sens distincts. En effet, dans ce cas, le voisinage s6mantique du concept 
comporte des concepts voisins de sens differents de ce concept. 

Cette ambiguity est parfois prise en compte dans le calcul de la fonction de 

20 pertinence, en r6duisant le rdsultat obtenu par I'estimation de la presence du concept pris 
dans un sens predetermine par un r6sultat obtenu par I'estimation de la presence de 
concepts pris dans un sens different. Ainsi, par exemple, un document dans lequel la 
presence de concepts pris dans un sens different est sup6rieure k la presence de 
concepts pris dans le sens predetermine n'est plus consid6r6 comme etant pertinent par 

25 rapport au concept. 

Ce type de procede prenant en compte I'ambiguite du concept risque done de 
consid6rer un document pouvant interesser I'utilisateur comme ayant une mauvaise 
pertinence par rapport k ce concept, par exemple au cas oij une fausse detection 
d'ambiguite adviendrait. 

30 L'invention a pour but de rem6dier k cet inconvenient en fournissant un procede 

d'estimation de la pertinence d'un document par rapport a un concept capable de prendre 
en compte I'ambiguTte du concept sans degrader I'estimation de la pertinence du 
document par rapport au concept. 

A cet effet, l'invention a pour objet un procede d'estimation de la pertinence d'un 

35 document par rapport k un concept, comprenant le calcul d'une fonction de pertinence du 
concept par rapport k ce document s'appuyant sur la connaissance d'un voisinage 
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s6mantique predetermine de ce concept, caract6ris6 en ce qu'il comporte en outre le 
calcul d'une fonction d'ambiguite de ce concept dans ce document, distincte de la fonction 
de pertinence, ce calcul 6tant estim6 k partir de la presence dans le document de 
differents sens de ce concept. 
5 Ainsi, la prise en compte de I'ambiguYte est d6corr6l6e du calcul de la fonction de 

pertinence. La pertinence du document reste done inchang6e en cas d'ambiguTte, et e'est 
un score determinant uniquement rambiguite qui avertit Tutilisateur du fait que le 
document est susceptible de rint6resser ou non. 

Dans le cas d'une fausse detection d'ambiguTte, te document sera toujours 
10 consid6r6 comme pertinent par rapport au concept, puisque seul le score determinant 
rambiguite est susceptible d'etre errone. 

Un proc6d6 selon I'invention peut en outre comporter Tune ou plusieurs des 
caract6ristiques suivantes : 

la fonction de pertinence mesure la presence du concept et des concepts du 
15 voisinage s6mantique de ce concept dans le document ; 

le voisinage s6mantique du concept comporte plusieurs nuages s6mantiques 
de sens distincts, et la fonction d'ambiguTte compare la presence de 
concepts appartenant k un nuage s6mantique correspondant k un sens 
predetermine du concept avec la presence de concepts appartenant k des 
20 nuages semantiques diff6rents ; 

la presence de chacun des concepts appartenant aux diff6rents nuages 
semantiques est ponderee par un coefficient predetermine ; 
le procede comporte une etape prealable de detection de concepts ambigus, 
e'est k dire de concepts comportant plusieurs nuages semantiques de sens 
25 diff6rents dans leur mdme voisinage s6mantique ; 

lors de retape de detection prealable, deux concepts sont considers 
comme ambigus s'ils sont relies entre eux par au moins deux liens 
semantiques differents. 

lors de l'6tape de detection prealable, un concept est consid6r6 comme 
30 ambigu s'il est relie k au moins deux nuages semantiques de sens 

differents ; 

le concept appartient k une base de connaissance obtenue par fusion d'une 
premiere base de connaissances avec une seconde base de connaissances, 
retape prealable de detection des concepts ambigus etant r6alis6e lors de la 
35 fusion. 
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lors de rttape de detection des concepts ambigus, un concept de la 
premi&re base de connaissances est considtrt comme ambigu s'il est relit 
par un nouveau lien k un autre concept de la premiere base de 
connaissances. 

5 - lors de I'ttape de detection des concepts ambigus, un concept de la 

premiere base de connaissances est considtrt comme ambigu s'il est relit k 
au moins un nuage stmantique de la seconde base de connaissances. 
On notera qu'on appelle nuage stmantique d'un concept considtrt, un ensemble 
constitut de concepts relics k un mtme sens du concept considtrt. 
10 Par exemple, le concept « Orange » comporte dans son voisinage stmantique au 

moins deux nuages stmantiques de sens difftrents, k savoir un nuage stmantique se 
rapportant k la couleur orange (comportant entre autres les concepts « couleur », 
«jaune», « rouge », etc.) et le nuage stmantique se rapportant au fruit orange 
(comportant entre autres les concepts « fruit », « agrume », « citron » t etc. ). 
15 L'invention sera mieux comprise k la lecture de la description qui va suivre, donnte 

uniquement k titre d'exemple et faite en se rtftrant aux dessins annexes dans lesquels : 
la figure 1 reprtsente schtmatiquement une base de connaissances 
constitute de concepts et de liens stmantiques entre eux ; 
les figures 2 et 3 reprtsentent schtmatiquement une mtthode de dttection 
20 de concepts ambigus, mise en ceuvre dans un proc6d6 selon Tinvention et ; 

la figure 4 repr6sente sch§matiquement un proc6d6 d'estimation de la 
pertinence d'un document par rapport & un concept selon l'invention. 
On a repr£sent£ sch6matiquement sur la figure 1 une base de connaissances que 
Con d6signera par la r6f6rence g6n6rale 10. 
25 On notera que, dans cet exemple, la base de connaissances 10 est constitute d'une 

base de connaissances 10A a laquelle on a ajoutt une base de connaissances 10B, 
selon un proctdt de fusion de bases de connaissances connu en soit. 

Un concept 12 de la base de connaissances 10 est relit k d'autres concepts par des 
liens stmantiques 14. 

30 L'ensemble des concepts ainst relits au concept 12 forme un voisinage stmantique 

de ce concept 12. Ce voisinage stmantique peut comporter plusieurs nuages 
stmantiques 16 de sens distincts, un nuage stmantique 16 du voisinage du concept 12 
etant, comme cela a 6t6 dtfini prectdemment, un ensemble constitut de concepts relits 
k un meme sens du concept 12 consider^. 

35 Lorsqu'un concept 12 est relit k plusieurs nuages stmantiques 16 de sens distincts, 

ce concept est dit « ambigu ». Les concepts ambigus sont dtsignts sur la figure 1 par la 
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reference g6n6rale 18, et par les references particuli&res 18A, 18B et 18C, ces references 

particulifcres correspondant k differents modes de detection des concepts ambigus, mis 

en oeuvre lors d'une etape prealable d'analyse de la base de connaissances 10. Cette 

etape sera d6taill6e en reference aux figures 2 et 3. 
5 Durant cette etape pr6alable f les concepts possedant plusieurs nuages s6mantiques 

de sens differents dans leur voisinage s6mantique sont marques comma etant ambigus. 
La figure 2 represents une mise en oeuvre de cette etape pr6alable, adapfee pour la 

detection de concepts ambigus dans une base de connaissances donn6e, par exemple 

ici, la base de connaissances 10A. 
10 Chaque concept 12 de la base de connaissances 10A est analyse lors d'une etape 

20 durant laquelle on recherche au moins deux liens s6mantiques differents reliant ce 

concept 12 k un seul autre concept. 

Dans le cas oil ces liens existent, on passe k une etape 21 au cours de laquelle le 

concept est marque comme etant un concept ambigu 18A, puisque la presence d'au 
15 moins deux liens vers un m£me autre concept indique une forte probabilife pour que ces 

liens concernent des sens differents de ce concept. 

Dans le cas contraire, on passe k une etape 22 lors de laquelle on recherche au 

moins deux liens s6mantiques reliant ce concept 12 k deux nuages s6mantiques de sens 

differents. 

20 Dans le cas ou ces liens existent, le concept est par definition un concept ambigu. 

On passe alors k une etape 23 lors de laquelle il est marque comme etant un concept 
ambigu 18B. 

Dans le cas contraire, le concept 12 n'est pas consider comme etant ambigu, et on 
passe k une etape 24 de fin d'etape prealable d'analyse de la base de connaissances 
25 10A. 

La figure 3 repr6sente une mise en oeuvre de retape prealable de detection des 
concepts ambigus, plus particuli&rement lors de la fusion de la base de connaissances 
10A avec la base de connaissances 10B. Les nouveaux liens cr66s entre concepts lors 
de cette fusion sont representee sur la figure en traits interrompus. 

30 Chaque concept 12 existant dans la base de connaissance 10A est alors analyse 

lors d'une etape 25 durant laquelle on recherche au moins un nouveau lien semantique 
reliant ce concept 12 a un autre concept existant de la base de connaissance 10A, ce 
nouveau lien ayant et6 cr6e lors de la fusion des deux bases 10A et 10B. 

Dans le cas ou un tel nouveau lien exists, on passe & une 6tape 26, durant laquelle 

35 le concept est marque comme etant un concept ambigu 18C, puisque la relation entre ces 
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deux concepts rV6tait pas pr6vue dans la base de connaissances initials 10A, ce qui 
Implique qu'il s'agit potentiellement d'homonymes. 

Dans le cas contraire, on passe k une 6tape 27, durant laquelle chaque concept 12 
existant dans la base de connaissance 10A est de nouveau analyst, pour rechercher au 
5 moins un lien sdmantique reliant ce concept 12 k un nuage de nouveaux concepts de la 
base de connaissances 10B. 

Dans le cas ou un tel lien existe, on passe k une 6tape 28 durant laquelle le concept 
est marquS comme 6tant un concept ambigu 18D, puisqu'il est probable que ce lien vers 
ces nouveaux concepts concerne un homonyme. 
10 Dans le cas contraire, le concept 12 n'est pas consid6r6 comme 6tant ambigu, et on 

passe k une dtape 29 de fin d'dtape pr6alable d'analyse de la base de connaissances. 

Une fois cette 6tape pr§alable de recherche de concepts ambigus effectu6e, il est 
possible d'estimer la pertinence d'un document par rapport k un concept donnd de la 
base de connaissances 10, par le proc6d6 repr6sent6 sch6matiquement sur la figure 4. 
15 Lors d'une premi&re 6tape 30, une requSte d'estimation de la pertinence d'un 

document par rapport k un concept 12 de la base de connaissances 10 est 6mise, par 
exemple par un moteur de recherche. 

Une fois cette requdte 6mise, on passe k une 6tape 32, durant laquelle un calcul 
d'une fonction de pertinence du document par rapport au concept 12 est effectu6 de 
20 mani&re connue en soi. Cette fonction de pertinence est calculde en prenant en compte la 
presence dans le document du concept 12 et de concepts appartenant au voisinage 
s6mantique de ce concept 1 2. 

Ainsi, par exemple, la fonction de pertinence est donnee par liquation suivante : 
Pertinence(Doc, 12) = f[Pr6sence(Doc, 12), coef x Pr6sence(Doc, voisinage(12))], 
25 ou: 

Pertinence(Doc, 12) est la fonction de pertinence du concept 12 dans le 
document considere ; 

Pr6sence(Doc, 12) est une fonction quantifiant la presence du concept 12 
dans le document consid6r6, par exemple, le nombre de fois ou le concept 
30 1 2 apparait dans le document ; 

Pr6sence(Doc, voisinage(12)) est une fonction quantifiant la pr6sence dans 
le document consid6r£ de concepts appartenant au voisinage du concept 
12; 

coef est un coefficient de ponderation pr6d6termine, permettant de 
35 d'accorder plus ou moins d'importance aux concepts appartenant au 

voisinage s6mantique du concept 12 ; 
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f est par exemple une fonction « maximum >\ ou une fonction « somme ». 
En fonction du r£sultat obtenu par ce calcul, le document peut 6tre consid£rd 
comme 6tant pertinent vis k vis du concept 12, par exemple si le calcul donne un r6£ultat 
supdrieur k un seuil pr6d6termin6. Dans ce cas, on passe k une 6tape 34 au cours de 
5 laquelle le document est marqud comme 6tant pertinent par rapport au concept 12. 

Dans le cas contraire, ou le r6sultat du calcul donne un rdsultat interieur au seuil 
pr6d6termin6, on passe k une dtape 36 au cours de laquelle le document est marqu6 
comme n'6tant pas pertinent par rapport au concept 12. Dans ce cas, le document non 
pertinent n'est pas retenu. 
10 Dans le cas ou le document est marqu6 comme 6tant pertinent, le proc6d6 selon 

invention prdvoit ensuite le calcul d'une fonction d'ambiguitt du concept dans le 
document. 

Lors d'une 6tape 38, on v6rifie si le concept 12 sur lequel porte la requdte est 
marqu6 comme 6tant ambigu ou non dans la base de connaissances 10. 
15 S'il n'est pas marqu6 comme 6tant ambigu, on passe k une 6tape 40 au cours de 

laquelle le document est marqu6 comme 6tant pertinent et non ambigu. 

Si le concept 12 est marqu6 comme 6tant ambigu, on passe k une 6tape 42 durant 
laquelle on proc6de k un calcul de la fonction d'ambigu'itd, comparant la presence de 
concepts appartenant k un nuage s6mantique correspondant k un sens pr6d6termin6 du 
20 concept 12 (le sens du concept dans la requdte) avec la presence de concepts 
appartenant k des nuages s6mantiques differents. 

Ainsi, la fonction d'ambiguTte peut §tre donn6e par liquation suivante : 
Ambiguit6(Doc, 12) = f[coef1 x Pr6sence(Doc, nuagel), coef2 x Pr6sence(Doc, 
nuage2)], 
25 ou: 

Ambiguft6(Doc, 12) est la fonction d'ambiguTte du concept 12 dans le 
document consid£r6 ; 

nuagel et nuage2 sont deux nuages s6mantiques differents relies au 
concept 12 consid§r6 ; 

30 - Pr6sence(Doc, nuagel) quantifie la presence de concepts appartenant au 

nuage 1 dans le document considers ; 

coefl est un coefficient pr6d6termin6, permettant d'accorder plus ou moins 
d'importance aux concepts appartenant au nuage 1 ; 

Presence(Doc, nuage2) quantifie la pr6sence de concepts appartenant au 
35 nuage 2 dans le document considers ; 
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coef2 est un coefficient pr6d6termin6, permettant d'accorder plus ou moins 
d'importance aux concepts appartenant au nuage 2 ; 
f est une fonction de comparaison. 
Une fois ce score d'ambiguTtd calculd, on passe & une 6tape 44 au cours de laquelle 
5 le document, est marqud comme pertinent avec un score d'ambiguTM, et il ne tient ainsi 
qu'& I'utilisateur d'estimer, h I'aide de ce score d'ambiguftd, si fe document est susceptible 
de I'int6resser ou non. 

II apparalt clairement qu'un proc6d6 d'estimation de la pertinence d'un document 
par rapport k un concept donn6, tei que d6crit pr6c6demment t foumit de meilleurs 
10 r6sultats que les proc6d§s existants, en pond6rant la pertinence par un calcul d'ambiguit6 
sans affecter Testimation de la pertinence elle-mdme. 
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1 . Procddd d'estimation de la pertinence d'un document par rapport & un concept 
(12), comprenant le calcul (32) d'une fonction de pertinence du concept (12) par rapport & 

5 ce document s'appuyant sur la connaissance d'un voisinage sdmantique prdddtermind de 
ce concept (12), caractdrisd en ce que, si le document est considdrd comme pertinent: 

- On calcule (42) une fonction d'ambiguTtd de ce concept (12) dans ce document, 
distincte de la fonction de pertinence, ce calcul dtant estimd k partir de la presence dans 
le document de diffdrents sens de ce concept, et 

10 - On associe (44) un score d'ambigu'ttd au document considdrd comme pertinent. 

2. Procddd d'estimation de la pertinence d'un document par rapport k un concept 
(12) selon la revendication 1, dans lequel la fonction de pertinence mesure la presence du 
concept (12) et des concepts du voisinage sdmantique (16) de ce concept (12) dans le 
document. 

15 3. Procddd d'estimation de la pertinence d'un document par rapport k un concept 

(12) selon la revendication 1 ou 2, dans lequel, le voisinage sdmantique de ce concept 
(12) comportant plusieurs nuages sdmantiques (16) de sens distincts, la fonction 
d'ambiguitd compare la prdsence de concepts (12) appartenant k un nuage sdmantique 
(16) correspondant k un sens prdddtermind du concept (12) avec la prdsence de 

20 concepts appartenant k des nuages sdmantiques (16) d iff 6 rents. 

4. Procddd d'estimation de la pertinence d'un document par rapport k un concept 
(12) selon la revendication 3, dans lequel la prdsence de chacun des concepts 
appartenant aux diffdrents nuages sdmantiques (16) est ponddrde par un coefficient 
prdddtermind. 

25 5. Procddd d'estimation de la pertinence d'un document par rapport k un concept 

(12) selon Tune quelconque des revendications 1 k 4, comportant une dtape prdalable de 
ddtection de concepts ambigus (18), c'est k dire de concepts comportant plusieurs 
nuages sdmantiques (16) de sens diffdrents dans leur mdme voisinage sdmantique. 

6. Procddd d'estimation de la pertinence d'un document par rapport k un concept 

30 (12) selon la revendication 5, dans lequel, lors de I'dtape de ddtection prdalable, deux 
concepts sont considdrds comme ambigus (18A) s'ils sont relids entre eux par au moins 
deux liens sdmantiques (14) diffdrents. 

7. Procddd d'estimation de la pertinence d'un document par rapport k un concept 
(12) selon la revendication 5 ou 6, dans lequel, lors de I'dtape de ddtection prdalable, un 

35 concept est considdrd comme ambigu (18B) s'il est relid k au moins deux nuages 
sdmantiques (16) de sens diffdrents. 
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8. Procede d'estimation de la pertinence d'un document par rapport a un concept 
(12) selon I'une quelconque des revendications 5 a 7, dans lequel, le concept (12) 
appartenant a une base de connaissance (10) obtenue par fusion d'une premiere base de 
connaissances (10A) avec une seconde base de connaissances (10B). I'etape prealable 

5 de detection des concepts ambigus est realisee lors de la fusion. 

9. Proc6de d'estimation de la pertinence d'un document par rapport a un concept 
(12) selon la revendication 8, dans lequel, lors de I'etape de detection des concepts 
ambigus, un concept de la premiere base de connaissances (10A) est considere comme 
ambigu (18C) s'il est reli6 par un nouveau lien a un autre concept de la premiere base de 

10 connaissances (1 OA). ' 

10. Proced6 d'estimation de la pertinence d'un document par rapport a un concept 
(12) selon la revendication 8 ou 9, dans lequel, lors de I'etape de detection des concepts 
ambigus, un concept de la premiere base de connaissances (10A) est consider^ comme 
ambigu (18C) s'il est relie a au moins un nuage semantique de la seconde base de 

1 5 connaissances (1 0B). 
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